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Spracherkennungs- und Korrektursvstem 



Die Erfindung bezieht sich auf ein Spracherkennungs- und Korrektursystem, 
5 das zumindest eine Spracherkennungseinrichtung, der ein gesprochener Text zufuhrbar und 
in einen erkannten Text transkribierbar ist, sowie eine mit der zumindest einen 
Spracherkennungseinrichtung fiber ein Datennetz zur tJbertragung des erkannten Textes 
und gegebenenfalls des gesprochenen Textes verbundene Korrektureinrichtung zum 
Korrigieren des von der zumindest einen Spracherkennungseinrichtung erkannten Textes 
10 umfasst. _ 

Die Erfindung bezieht sich weiters auf eine Korrektureinrichtung zum 
Korrigieren eines von einer Spracherkennungseinrichtung erkannten Textes. 

Die Erfindung bezieht sich weiters auf ein Alternativen-Lexikon- 
Erstellungsverfahren zum Ermitteln von Datensatzeintragen fur ein Alternativen-Lexikon 
15 fur die Korrektur von erkanntem Text, der von einer Spracherkennungseinrichtung aus 
gesprochenem Text transkribiert wurde. 

Ein solches Spracherkennungs- und Korrektursystem ist aus dem Dokument 
20 US 5,864,805 bekannt Dieses Dokument offenbart ein kontinuierlich arbeitendes 

Spracherkennungssystem mit der Fahigkeit, Fehler in Worten und Wortfolgen zu erkennen 
und zu korrigieren. Zur Korrektur von Fehlern werden Daten im internen Speicher des 
Spracherkennungssystems gespeichert, urn damit im Spracherkennungssystem gefuhrte 
Wahrscheinlichkeitstabellen zu aktualisieren, die bei der Entwicklung von Alternativen- 
25 Listen fiir die Ersetzung von felsch erkanntem Text dienen. 

Bei dem bekannten Spi»cherkennungs- und Korrektursystem hat sich als 
Nachteil erwiesen, dass es bloB als Stand-alone-Losung benutzbar ist, das heiBt, dass dieses 
Spracherkennungs- und Korrektursystem auf einen Einzelplatz-Computer beschrankt ist, in 
dem samtliche Daten gespeichert sind, die das Spracherkennungs- und Korrektursystem 
30 benotigt Moderne Spracherkennungssysteme sind mitflerweile jedoch oftmals als verteilte 
Systeme ausgefuhrt, bei denen eine Vielzahl von Computern mit darauf laufender 
Spracherkennungssoftware oder Teilen davon fiber ein Datennetzwerk miteinander 
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verbunden sind. Oftmals ist bei diesen fortgeschrittenen Systemen auch eine Verteilung der 
Aufgaben des Spracherkennungs- und Korrektursystems auf mehrere Computer 
vorgesehen. Als Beispiel dafur sei ein Spracherkennungssystem erwabnt, wie es bei der 
klinischen Diagnose in Krankenhausern verwendet wird. Dabei werden von vielen Arzten 
5 in verschiedenen Untersuchungszimmern Diagnosen in das Spracherkennungssystem 
diktiert, die vom Spracherkennungssystem in einen erkannten Text umgewandelt und 
zusammen mit einer Audio-Aufceichnung des gesprochenen Textes zentral gespeichert 
werden. Bei dem erkannten Text handelt es sich allerdings noch urn eine Rohfassung, die 
in einem Korrekturvorgang von allfalligen Erkennungsfehlern bereinigt werden muss. 

1 0 Diese Korrektur wird meist von einer Sekretarin durchgefiihrt, wobei es ublich ist, dass 
eine einzige Sekretarin die Diktate einer Vielzahl von Arzten korrigiert Da bei diesem 
Spracherkennungssystem sowohl die Arzte in den einzelnen Untersuchungszimmern als 
auch die Sekretarin in einem Biiro voneinander entfernt und meist auch zu 
unterschiedlichen Zeiten arbeiten, ist die in dem Dokument US 5,864,805 vorgeschlagene 

1 5 Losung fiir ein verteiltes Spracherkennungssystem nicht anwendbar. Andererseits ist es 
auch nicht praktikabel, die beim Transkriptionsvorgang des Spracherkennungssystems 
anfallende Information, die zur Erstellung von Altemativen-Listen fiir die Korrektur 
benutzt werden konnte, iiber ein Datennetzwerk an jenen Computer zu iibertragen, auf dem 
die Korrektur des erkannten Textes durchgefiihrt werden soil, da die anfollenden 

20 Datenmengen viel zu hoch waren. So wfirden die in dem Dokument US 5,864,805 
erwahnten Wahrscheinlichkeitstabellen viel zu schnell anwachsen, urn in standiger 
Aktualisierung fiber ein Datennetzwerk an eine Korrektureinrichtung iibertragen zu 
werden, insbesondere wenn es sich urn ein Datennetzwerk mit geringer Bandbreite handelt. 
Es ist in der Praxis auch nicht durchfuhrbar, die beim Transkriptionsvorgang des 

25 Spracherkennungssystems anfollende Information direkt an eine Korrektureinrichtung zu 
iibertragen und die Information dort zu analysieren, da auch in diesem Fall die benotigten 
Netzwerkbandbreiten, speziell fur Netzwerke mit geringer Bandbreite viel zu hoch waren. 
Es ist namlich dabei zu bedenken, dass moderne Spracherkennmgssysteme typischerweise 
5.000 bis 8.000 Wahrscheinlichkeitshypothesen, wie ein gesprochener Text in erkannten 

30 Text umgewandelt werden konnte, parallel bearbeiten. Information aus diesen 

Wahrscheinlichkeitshypothesen ware aber fiir die Korrektureinrichtung erforderlich. Wenn 
nun beispielsweise ein Erkennungsergebnis, dh. die beste Hypothese aus 1000 Wortem 
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besteht und jedes Wort zehnmal im zugrundeliegenden Wortgraph vorkommt, miisste man 
im Extremfall Varianten ubertragen, die aus 1000 hoch 10 Wortern bestehen und sich nur 
durch unterschiedHche zeitliche Aufteilung unterscheiden. 

Andererseits ist, obwohl die EntwicWer von Spracherkennungssystemen 

5 intensiv an Verbesseiungen ihrer Systeme arbeiten, auf absehbare Zeit noch keine 100%- 
ige Erkennungsrate zu erwarten, so dass weiterhin Koirekturen am erkannten Text 
erforderlich sein werden. Es besteht daher ein Bedurtnis, diese Korrekturarbeit zu 
erleichtern, indem der korrigierenden Person wahrend der Korrektur Alternativen zu falsch 
erkannten Wortern angeboten werden, so dass sie eine der angebotenen Alternativen rasch 

10 auswahlen kann. 

Die Erfindung hat sich zur Aufgabe gestellt, ein Spracherkennungs- und 
Korrektursystem gemaB der in dem ersten Absatz angegebenen Gattung, eine 

1 5 Korrektureinrichtung gemaB der in dem zweiten Absatz angegebenen Gattung und ein ; 
Alternativen-Lexikon-ErsteUungsverfahren gemaB der in dem dritten Absatz angegebenen 
Gattung zu schaffen, wobei die vorstehend ermuterten Nachteile vermieden sind. Zur 
Losung vorstehend angegebener Aufgabe istbei einem solchen Spracherkennungs- und 
Korrektursystem vorgesehen, dass die Korrektureinrichtung ein Alternativen-Lexikon 

20 aufweist, das Wortteile, Worter bzw. Wortfolgen enthalt, die von der Korrektureinrichtung 
als Alternativen zu einzelnen Wortteilen, Wortern bzw. Wortfolgen des erkannten Textes 
anzeigbar sind. 

Zur Losung vorstehend angegebener Aufgabe ist bei einer solchen 
Kon-ektureinrichtung vorgesehen, dass in der Korrektureinrichtung ein Altemativen- 
25 Lexikongespeichert ist, das Wortteile, Worter bzw. Wortfolgen enthalt, die von der 

Korrektureinrichtung als Alternativen zu einzelnen Wortteilen, Wortern bzw. Wortfolgen 

des erkannten Textes anzeigbar sind. 

Der Begriff , Alternativen-Lexikon" ist dabei so zu verstehen, dass es auf 
Informationen basiert, die vom Transkriptionsvorgang von Spracherkermungseinrichtungen 
30 unabhangig sind. Insbesondere basiert das Alternativen-Lexikon nicht auf alternativen 
Erkennungshypothesen, die von Spracherkennungseinrichtungen wahrend des 
Transkriptionsvorgangs auch aufgestellt und bezugUch der Wahrschemlichkeit ihres 
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Zutreffens schlechter bewertet wurden als die sich im erkannten Text widerspiegelnde 
Erkennungshypothese. 

Zur Losung vorstehend angegebener Aufgabe ist bei einem solchen 
Altemativen-I^xikon-Erstellungsverfahren vorgesehen, dass von der 
5 Spracherkeimungseinrichtung unabhangige Wissensquellen, insbesondere fur das 

Anwendungsgebiet spezifische Textdateien, wie medizinische oder juristische Texte, oder 
aus einer Vielzahl von korrigierten Texten und zugehorigen von 
Spracherkennungseinrichtungen erzeugten erkannten Texten (ET) erstellte 
Verwechslungsstalistiken, auf miteinander verwechselbare Textelemente, wie Wortteile, 

1 0 Worter bzw. Wortfolgen untersucht werden, und solche miteinander verwechselbaren 
Textelemente als Alternativen in einem Datensatzeintrag zusammengestellt werden. 

Durch die erSndungsgemaBen Merkmale ist erreicht, dass die Korrektur von 
durch ein Spracherkennungssystem erkannten Texten wesentlich einfacher und schneller 
als bisher durchgefuhrt werden kann, wobei die Erfindung besonders vorteilhaft bei 

1 5 Spracherkennungssystemen eingesetzt werden kann, bei denen Erkennung und Korrektur 
nicht auf demselben Computer durchgefuhrt wirtL Die durch die Erfindung erzielte Angabe 
von Korcekturalternativen ist dariiber hinaus uberaus effizient, jQexibel und robust, d.h. 
unabhangig von spezifischen Erkennungsfehlern. Neben dem Entfall eines umfengreichen 
Datentransfers zwischen Spracherkennungssystem und Korrektureinrichtung bei der 

20 Korrektur bietet die Erfindung dariiber hinaus den weiteren grofien Vorteil, dass die 
Alternatiworschlage aus dem Alternativen-Lexikon unabhangig von der jeweiligen 
Erkennungsleistung der Spracherkennungseinrichtung sind. Dem gegenuber bestand bei 
bisherigen Systemen der Nachteil, dass im Falle von geringer Erkennungsrate der 
Spracherkennungseinrichtung vielfach auch bei der Korrektur keine brauchbaren 

25 Alternativen angeboten wurden, da diese ebenfalls falsch waren. 

GemaB den Mafinahmen des Anspruchs 2 ist der Vorteil erhalten, dass die 
Korrektureinrichtung unabhangig von der wahrend des Transkriptionsvorgangs in dem 
Spracherkennungssystem anfallenden Information betreibbar ist, so dass abgesehen von der 
Obertragung des erkannten Textes und gegebenenfalls des zugrundeliegenden 

30 gesprochenen Textes keine Datenkommunikation zwischen dem Spracherkennungssystem 
und der Korrektureinrichtung erforderlich ist. Durch die groBe Flexibilitat der 
erfindungsgemaBen Losung ist auch eine einfache Adaption an neue Kontexte oder 
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Sprechstile erzielbar. Die Korrektureinrichtung kann sich in einer bevorzugten 
Ausgestaltung auf Analysemittel zum Analysieren von selektierten Textstellen des 
erkanntcn Textes stfitzen, die vorzugsweise mittels Zeichenkettenvergleich oder hoheren 
syntaktischen Analyseverfahren Alternativen zu den selektierten Textstellen aus dem 
Alternativen-Lexikon ermitteln. Syntaktische Analyseverfohren umfossen beispielsweise 
die Erfassung von syntaktischen Konstituenten, wie Nomen-Verb-Paaren, Nominalphrasen 
etc. 

GemaB den MaBnahmen des Anspruchs 4 ist der Vorteil erhalten, dass der 
Benutzer, beispielsweise fiber definierte Hot-Keys an der Tastatur der 
Kon-ektin^inrichtung, sich Alternativen zu den gerade bearbeiteten Stellen des erkannten 
Textes anzeigen lassen kann. 

GemaB den MaBnahmen des Anspruchs 5 wiederum ist der Vorteil erhalten, 
dass die Korrektureinrichtung fiber im Hintergrund laufende Analysemittel standig von sich 
aus Alternativen zu selektierten Textstellen anbieten kann. 

GemaB den MaBnahmen des Anspruchs 7 ist der Vorteil erhalten, dass das 
Alternativen-Lexikon sowohl offline wie auch online unabhangig von einem 
Spracherkennungssystem erstellt und aktualisiert werden kann, da die Wissensquellen, auf 
die zurfickgegriffen wird, unabhangig von jener Information sind, die beim 
Transkriptionsvorgang eines Spracherkennungssystems vorubergehend oder standig zur 
Verfugung steht 

GemaB den MaBnahmen des Anspruchs 8 ist der Vorteil erhalten, dass das 
Wissen zur Etmittlung von Datensatzeintragen aus der Erfohrung bzw. der Beobachtung 
stammt, welche Verwechslungen von einem Spracherkennungssystem besonders haufig 
gemacht werden. Beispielsweise werden naturgemafi homophone Worter, das heiBt gleich 
klingende, aber unterschiedlich geschriebene Worter vom Spracherkennungssystem 
besonders haufig verwechselt. Durch das Heranziehen der Korrekturinformation zur 
Erstellung eines Alternativen-Lexikons kann gleichsam die Leistung eines 
Spracherkennungssystems nachtraglich verbessert werden, ohne dass es erforderlich ist, 
das Spracherkennungssystem auf die gemachten Fehler erneut zu trainieren. Anders gesagt 
lernt das Korrektursystem aus den Fehlern des Spracherkennungssystems. 

Um die Robustheit des Verfehrens zur Erstellung von Datensatzeintragen in 
einem Alternativen-Lexikon zu erhohen, konnen vorteilhaft statistische Verfahren 
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herangezogen werden, wie in den Anspruchen 8 bis 10 dargelegt. Durch diese statistischen 
Verfahren wird einerseits erreicht, dass die Altemativen-Liste fur ein zu ersetzendes 
Wortelement nicht zu viele Eintrage bekommt und damit fur den Benutzer unhandlich 
wird, indem nur solche Alternativen aufgenommen werden, die hinreichend oft in der 
5 Korrektur vorkommen. Andererseits wird durch die Einfuhrung eines oberen Grenzwerts 
fiir die Haufigkeit einer Ersetzung wahrend der Korrektur sichergestellt, dass systematische 
Ersetzungen, die (fast) immer durch dasselbe Wortelement korrigiert werden, wie z.B. die 
Anweisung „Briefende" in einem Diktat durch „mit freundlichen Grussen, Dr. Meyer*' 
nicht als einzige Alternative angeboten werden, Ein solcher Fall sollte durch andere 

1 0 Mechanismen geregelt werden. 

GemaB den MaBnahmen des Anspruchs 1 1 ist der Vorteil erhalten, dass erkannt 
wird, ob es sich um eine „ernst zu nehmende" Ersetzung handelt, z.B. die Ersetzungen von 
,mein — dein', ,dem — den' etc. Die erforderliche phonetische Ahnlichkeit kann entweder 
uber den gesprochene Text, der in diesem Fall an die Korrektureinrichtung iibermittelt 

1 5 wird, oder aus der Lautschrift der betrachteten Worter, die der Korrektureinrichtung 
bekannt ist, ermittelt werden. 

GemaB den MaBnahmen des Anspruchs 12 ist der Vorteil erhalten, dass in die 
Altemativen-Liste nur solche Wortelemente aufgenommen werden, die zeitmaBig etwa an 
derselben Stelle im gesprochenen Text zu liegen kommen. Wenn beispielsweise 

20 systematisch vom Benutzer bei der Korrektur irgendwelche Worter oder Textabschnitte 
eingefiigt werden, die nichts mit dem gesprochenen Text zu tun haben oder systematisch 
Worter ausgelassen werden, die dann nicht im korrigierten Text aufscheinen, ist es nicht 
zweckmaBig, solche Korrekturen uber Altemativen-Listen abzuhandeln. 

Datensatzeintrage in einem Alternativen-Lexikon konnen unterschiedliche 

25 Detaillierungsgrade haben. So konnen unterschiedliche Alternativen-Listen je nach 
verwendeter Sprache im gesprochenen Text erstellt werden. Weiters konnen die 
Datensatzeintrage des Altemativen-Lexikons nach Fachgebieten bzw. 
Anwendungsgebieten unterteilt werden oder nach Autoren des zugrundeliegenden 
gesprochenen oder korrigierten Textes unterteilt werden. Es sind auch Kombinationen der 

30 oben erwahnten Detaillierungsgrade moglich. 

GemaB den MaBnahmen des Anspruchs 17 ist der Vorteil erhalten, dass das 
Alternativen-Lexikon wahrend der Korrektur von erkannten Texten laufend verbessert wird 
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und sich somit selbst trainiert. 

Die Erfindung wild im Folgenden anhand von einem in der Figur dargestellten 
5 AusfUhrungsbeispiel beschrieben, auf das die Erfindung aber nicht beschrankt ist 

Die Figur 1 zeigt ein Spracherkennungssystem mit einem damit iiber ein 
Datennetzwerk verbundenen Korrektursystem. 

10 Die Figur 1 zeigt eine Spracherkennungseinrichtung 1 zum Transkribieren 

eines gesprochenen Textes GT. Die Spracherkennungseinrichtung 1 kann dutch einen 
Computer gebildet sein, der eine Spracherkennungssoftware abarbeitet. Die 
Spracherkennungseinrichtung 1 umfasst Spracherkennungsmittel 7, 
Parameterspeichermittel 9, Befehlsspeichermittel 10 und eine Adaptionsstufe 11. Uber ein 

1 5 Mikrophon 5 ist ein gesprochenen Text GT reprasentierendes Audiosignal A an einen A/D- 
Wandler 6 abgebbar, der das Audiosignal A in digitale Audiodaten AD wandelt, die den 
Spracherkennungsmitteln 7 zufuhrbar sind. Die digitalen Audiodaten AD werden von den 
Spracherkennungsmitteln 7 in erkannten Text ET umgewandelt, der iiber ein 
Datennetzwerk 2 in Speichermitteln 8 gespeichert wird. Dazu werden in den 

20 Parameterspeichennitteln 9 gespeicherte Parameterinformationen PI berficksichtigt, die 
Wortschatzmformationen, Sprachmodellinformationen und Akustikinformationen 
enthalten. 

Die Wortschateinformationen beinhalten samtliche mit den 
Spracherkennungsmitteln 7 erkennbaren Worter samt zugehorigen Phonemfolgen. Die 

25 Wortschatzinformationen werden durch die Analyse einer Vielzahl von fur die vorgesehene 
Anwendung relevanten Texten gewonnen. Beispielsweise werden fiir ein 
Spracherkennungssystem, das auf dem Gebiet der Radiologic eingesetet wird, Befuhde mit 
einer Gesamtanzahl von 50 bis 100 Millionen enthaltenen Wortern analysiert Die 
Sprachmodellinformationen enthalten statistische Informationen zu in der Sprache des 

30 gesprochenen Textes GT ublichen Abfolgen von Wortern, insbesondere die 

WahrscheinUchkeiten fur das Auftreten von Wortern und ihren Zusammenhang mit vor- 
undnachstehenden Wortern. Die Akustikinformationen enthalten Informationen fiber die 
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Eigenarten der Aussprache eines Benutzers der Spracherkeimungseinrichtung 1 und iiber 
akustische Eigenschaften des Mikrophons 5 und des A/D-Wandlers 6. 

In dem Dokument US 5,031,1 13, dessen Offeribarung dutch diesen Hinweis als 
in die Offenbarung dieses Dokuments aufgenommen gilt, ist die Abarbeitung eines 
5 Spracherkennungsverfahrens unter Beriicksichtigung solcher Parameterinformationen PI 
offenbart, weshalb hierauf nicht naher eingegangen wird. Als Ergebnis des 
Spracherkennungsverfahrens sind von den Spracherkennungsmitteln 7 den erkannten Text 
ET enthaltende Textdaten in den Speichermitteln 8 speicherbar. Weiters ist in den 
Speichermitteln 8 der gesprochene Text GT in digitalisierter Form speicherbar. Zusatzlich 

10 wird von dem Spracherkexmungssystem 1 Information fiber die verwendete Sprache 14, 
die Anwendung 15 und den Autor 16 zusammen mit dem erkannten Text ET fiber das 
Datennetzwerk 2 fibertragen und in den Speichermitteln 8 abgespeichert. 

In der Befehlsspeicherstufe 10 sind Abfolgen von Worten gespeichert, die von 
den Spracherkennungsmitteln 7 als Kommando erkannt werden. Solche Kommandos 

15 umfassen beispielsweise die Abfolge der Worte „next word bold", urn das nachste Wort in 
dem erkannten Text ET fett darzustellen. 

Eine Korrektureinrichtung 3 hat Zugriff auf den in den Speichermitteln 8 
abgespeicherten erkannten Text ET, um ihn zusammen mit der akustischen Information 
fiber den zugrundeliegenden gesprochenen Text GT und die Informationen fiber die 

20 Sprache 14, die Anwendung (das Fachgebiet) 15 und den Autor 16 einzulesen, so dass der 
erkannte Text ET mit einem Textverarbeitungssystem korrigiert werden kann. 
Insbesondere sind auf den erkannten Text ET alle Funktionen anwendbar, fiber die 
fortgeschrittene Spracherkennungssoftware verfugt, wie unten erlautert wird. Die 
Korrektureinrichtung 3 verfugt fiber Wiedergabe- und Korrekturmittel 1 8, an die eine 

25 Tastatur 19, ein Monitor 20 und ein Lautsprecher 21 angeschlossen sind. Die Wiedergabe- 
und Korrekturmittel 1 8 sind zum visuellen Darstellen des erkannten Texts ET am Monitor 
20 sowie zum akustischen Wiedergeben des gesprochenen Textes GT am Lautsprecher 21 
und zum synchronen visuellen Markieren der gerade akustisch wiedergegebenen Stellen 
des gesprochenen Textes im erkannten Text ET ausgebildet, wenn sich die Wiedergabe- 

30 und Korrektwrmittel 1 8 in aktivierter synchroner Wiedergabebetriebsart befinden. In dieser 
Wiedergabebetriebsart ist gleichzeitig das Korrigieren des erkannten Textes mittels 
Tastatureingabe sowie gegebenenfalls mittels Sprachbefehlen fiber ein nicht dargestelltes 
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Mikrophon moglich. Der koirigierte Text KT ist in Sptichermitteln 17 speicherbar. 

Die Wiedergabe- und Korrekturmittel 1 8 umfassen Analysemittel 24 zum 
Analysieren von gerade selektierten Textstellen des erkannten Textes ET, ran dem 
Benutzer der Kon-ektureinrichtung Altemativen 2x1 den selektierten Textstellen aus einem 
Altemativen-Lexikon 23 vorzuschlagen, das in der Korrektureinrichtung 3 gespeichert ist. 
Die Altemativen werden dem Benutzer in Form einer Alternativen-Liste 22 am Monitor 
prasentiert, in der er mittels Cursor-Tasten der Tastatur 19 oder einer nicht dargestellten 
Mans oder dergleichen navigieren kann, urn seine Auswahl zur Ersetzung zu treffen oder 
aber handisch eine Korrektur vorzunebmen. Die Analysemittel 24 arbeiten entweder 
kontinuierlich im Hintergrund oder sind vom Benutzer der Korrektureinrichtung 3 durch 
das Drucken einer Taste oder Tastenkombination (..Hotkey") aktivierbar. Die 
Analysemittel analysieren die selektierten Textstellen voizugsweise entweder durch 
Zeichenkettenvergleich oder ein syntaktisches Analyseverfehren. Der 
Zeichenkettenvergleich kann auf Einzelwortern oder Bestandteilen von Einzelwortern, oder 
auf (zu detektierenden) Phrasen beruhen. Der Vergleich kann weiters auf Ausdrucken aus 
mehreren syntaktischen Konstituenten, wie z.B. Nomen-Verb-Paare, Nominalphrasen etc. 
beruhen. All diese Ausdmcke werden in der vorliegenden Patentanmeldung auch allgemein 
mit dem Begriff Textelement bezeichnet Die von den Analysemitteln 24 vorgeschlagenen 
Altemativen-Listen konnen wiederum Einzelworte oder Teile davon, oder ganze Phrasen 
umfassen. Als Beispiel fiir die Ersetzung von Einzelworten sei der folgende erkannte Text 
genannt: „The epigastric vessels were seen interiorly, and he had history of edema" Die 
kursiv geschriebenen Worter wurden fehlerkannt. Wenn sich nun der Cursor bei der 
Korrektur dieses erkannten Textes uber dem Wort ,4nteriorly" befindet, wird von den 
Analysemitteln eine Alternativen-Liste zur Korrektur angeboten, die einen oder mehrere 
Eintrage enthalt, darunter auch das Wort „anteriorly", das in diesem Fall das korrekte Wort 
ware. Der Benutzer kann durch einfache Auswahl des Wortes „anteriorly" die schnelle 
Ersetzung von ^interiorly 44 durch dieses Wort veranlassen. Dasselbe gilt fur das Wort 
' „edema w , das durch das in einer weiteren Alternativen-Liste angebotene Wort „anemia" zu 
ersetzen ist. Der Benutzer kann somit mit wenigen Tastendrucken den fehlerkannten Satz 
zu: „The epigastric vessels were seen anteriorly, and he had history of anemia." richtig 
stellen. In einem Beispiel fur die Ersetzung von Phrasen kann als Alternative fiir die 
erkannte Phrase »rhythm without /fete" die korrekte Phrase rhythm without lifts" 
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angeboten werden. Es ist zu beachten, dass in diesem Fall, obwohl im erkannten Text bei 
der Ersetzung scheinbar nur ein Buchstabe geandert wird, die gesamte zitierte Phrase 
untersucht, als Alternative angeboten und bei entsprechender Auswahl durch den Benutzer 
der Korrektureinrichtung ersetzt wird. Ein weiteres Beispiel betrifft Alternativen mit 
5 mehreren Konstituenten. Diese Konstituenten konnen Fachausdrucke, Nomen- Verb-Paare, 
etc. sein. Die Analysemittel 24 konnen dabei einen Algorithmus anwenden, bei dem 
zunachst ein Tagging des erkannten Textes und die Berechnung von KonfidenzmaBen fiir 
die einzelnen Worter (Elemente) durchgefuhrt wird Fiir Nomen mit niedriger Konfidenz 
wird anschliefiend ein Nomen-Verb-Paar oder eine Nominalphrase ennittelt Daran 

10 anschliefiend wird fiir das komplementare Element (Verb oder Nomen) die Identitat der 
zugehorigen Altemativenliste durch einen Zeichenkettenvergleich ennittelt, worauf die 
Anzeige der anderen Elemente in Form einer Alternativen-Liste erfolgt. Durch dieses 
Verfahren kann beispielsweise im fehlerkannten Satz: „The extraneous tendinous materials 
were all debrided." die Richtigstellung des Wortes ^materials" durch „trails" in einer 

1 5 Alternativen-Liste angeboten werden, indem die Analysemittel 24 das niedrige 

Konfidenzmafi des Wortes „materials" feststellen, die Identifikation des Nomen- Verb- 
Paars material debrided" durchGihren und fiber das Verb „debrided" eine Bestimmung der 
relevanten Alternativen-Liste vomehmen, in der der Eintrag ^trails debrided" aufscheint. 
Falls dieser Eintrag vom Benutzer ausgewahlt wird, so werden das Nomen und das Verb 

20 ersetzt, auch wenn fur den Benutzer im Text nur die Ersetzung von ^materials" durch 
„trails" sichfbar wird, Als weiteres Beispiel fiir die Ermittlung von Alternativen mit 
mehreren Konstituenten sei der fehlerkannte Satz: discharge medications two CCU" 
angefuhrt, der eigentlich als disposition to CCU" erkannt werden hatte sollen. Die 
Analysemittel 24 stellen die niedrige Konfidenz des Wortes ^medications" fest und 

25 identifizieren die Nominalphrase „Discharge medications". Die Bestimmung eines 

relevanten Eintrags in der Alternativen-Liste erfolgt fiber den Begriff „CCU" und lautet 
„Disposition to CCU". Dieser Eintrag kann vom Benutzer ausgewahlt werden und ersetzt 
den gesamten, oben angefuhrten, fehlerkanntCTi Satz. 

Die Analysemittel 24 ermitteln selektierte Stellen des erkannten Textes ET 

30 beispielsweise aus der Cursorposition eines Textverarbeitungsprogramms, das zur 
Korrektur des erkannten Textes benutzt wird, oder aus der Zeitposition der gerade 
gesprochenen Textstelle und deren Verknupfung mit dem erkannten Text. Es ist fiir den 
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Benutzer der Korrektureinrichtung 3 somit eine effektive und schnelle Korrektur des 
erkannten Textes durch Auswahl von Altemativformulierungen moglich. 

Die Korrektureinrichtung 3 umfasst auch Auswertemittel 4 zur Erstellung des 
Alternativen-Lexikons 23 bzw. einzelner Eintrage davon. Es ist anzumerken, dass 
Auswertemittel auch unabhangig von der Korrektureinrichtung 3 vorgesehen sein konnen, 
um aus verschiedenen, von dem Spracherkennungssystem 1 unabhangigen Wissensquellen 
ein Basis-Alternativen-Lexikon zu erstellen, das dann in der Korrektureinrichtung 3 zur 
Verwendung gespeichert werden kann. Im dargestellten Ausfuhrungsbeispiel greifen die 
Auswertemittel 4 uber die Wiedergabe- und Korrekturmittel 18 auf die in den 
Speichermitteln 8 gespeicherten gesprochenen und erkannten Texte GT, ET sowie auf die 
Information uber die Sprache 14, die Anwendung 15 und den Autor 16 zu, wobei in einer 
alternativen Ausgestaltungsform auch ein direkter Zugriff der Auswertemittel 4 auf die 
Speichermittel 8 realisiert sein kann. Die Auswertemittel 4 lesen weiters den korrigierten 
Text KT aus den Speichennitteln 17 ein, um inn mit dem erkannten Text ET zu 
vergleichen und somit die an dem erkannten Text ET durchgefuhrten Textelement- 
Ersetzungen zu ermitteln. Diese Textelement-Ersetzungen werden statistisch analysiert und 
als Alternativen in Datensatzeintrage des Alternativen-Lexikons 23 aufgenommen, wenn 
sie bestimmte, weiter unten naher erlauterte Bedingungen erfullen. So wird in einer 
bevorzugten Ausgestaltungen der erkannte Text ET mit dem korrigierten Text KT 
verglichen und jene Ersetzungen ermittelt, die fiber den gesamten Text die geringste 
Gesamtabweichung, d.h. die minimale Fehleranzahl ergeben. Mit dieser Information wird 
die Alternativen-Liste erstellt Zur Verbesserung der Robustheit des Systems, d.h. um die 
Alternativen-Liste nicht mit zu vielen Eintragen zu fullen, ist es sinnvoll, eine Statistik zu 
erstellen, wie haufig ein Wortelement durch ein anderes ersetzt wird. Erst wenn ein 
vorgegebener unter Grenzwert der relativen oder absoluten Haufigkeit uberschritten wird, 
wird das ersetzende Wortelement in die Alternativen-Liste aufgenommen. Es kann auch 
sinnvoll sein, einen oberen Grenzwert der Hauflgkeit fur die Ersetzung eines Wortelements 
durch ein anderes einzufubren, der unterschritten werden muss, um das Wortelement in 
eine Alternativen-Liste aufzunehmen. Wird der obere Grenzwert uberschritten, so deutet 
dies entweder auf einen systematischen Fehler des Spracherkennungssy stems hin, der nicht 
fiber Alternativen-Listen bereinigt werden sollte, oder auf die Ersetzung von Textteilen, die 
nicht aufgrund von Fehlerkennungen durchgefuhrt wird. 
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Eine weitere MaBnahme zur Verbesserung der Robustheit der Erstellung eines 
Altemativen-Lexikons betriffi das Analysieren der phonetischen Ahnlichkeit der ersetzten 
und ersetzenden Begriffe. Man kann damit sicherstellen, dass diese Begriffspaare eine 
ausreichende phonetische Ahnlichkeit aufweisen, z3. mein - dein, dem - den, urn als 
5 Fehlerkeimung des Spracherkennungssystems angesehen zu werden, deren Aufixahme in 
eine Alternativen-Liste Sinn macht. 

Wieder eine andere MaBnahme zur Verbesserung der Robustheit der Erstellung 
eines Alternativen-Lexikons betriffi das Analysieren der Zeitposition, in der die 
korrigierten Textelemente liegen. In eine Altemativen-Liste werden demnach nur jene 

10 Textelemente aufgenommen, die zeitmaBig etwa an der entsprechenden Stelle im 

gesprochenen Text zu liegen kommen. Damit kann man verhindern, dass beispielsweise 
Worter, die vom Benutzer der Korrektureinrichtung aus Formatierungs- oder inhaltlichen 
Grunden in den erkannten Text eingefugt oder daraus geloscht werden, aber nichts mit der 
Korrektur von Fehlerkennungen zu tun haben, in Altemativen-Listen Eingang finden. 

1 5 Weiters konnen die Datensatze in dem Alternativen-Lexikon zusatzlich nach 

verwendeter Sprache, Anwendung (Fachgebiet) und Autor bzw. einer Kombination daraus 
unterteilt werden. Sobald ein erkannter Text ET zur Korrektur gelangt, von dem zusatzlich 
Information uber die Sprache 14, Anwendung (Fachgebiet) 15 und Autor 16 bekannt ist, 
wird die entsprechende Alternativen-Liste aus dem Alternativen-Lexikon 23 geladen und 

20 steht zum schnellen Abrufen von Alternativen zur Verfugung. 

Die Auswertemittel 4 arbeiten in der dargestellten Ausfuhrungsform standig im 
Hintergrund, so dass das Alternativen-Lexikon 23 online verbessert und somit gleichsam 
trainiert wird 

Neben der Auswertung des korrigierten Textes KT zur Erstellung des 
25 Alternativen-Lexikons 23 konnen die Auswertemittel 4 zusatzlich oder alternativ dazu 
auch auf andere von dem Spracherkennungssystem 1 unabhangige Wissensquellen 
zuruckgreifen, insbesondere auf Textdateien 12, z.B, klinische Beftmde, gegebenenfalls 
auch Verwechslungsstatistiken, die zur Erstellung von Datensatzeintragen im Alternativen- 
Lexikon 23 analysiert werden. Diese Dateien konnen einerseits auf einer Festplatte eines 
30 Computers gespeichert sein, auf dem die Analysemittel 4 abgearbeitet werden, andererseits 
kann auf solche Dateien auch fiber ein Datennetz zugegriffen werden. Vorteilhaft kann 
auch das Internet nach fur die Analyse geeigneten Internet-Dateien 13 durchsucht werden, 
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wobei dieser Vorgang - wie uberhaupt das gesamte Verfehren zur Ermittlung von 
Datensatzeintragen im Alternativen-Lexikon - sich sehr gut fur die Automatisierung 
eignet 
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Patentanspriiche: 

1 . Spracherkennungs- und Korrektursystem, das zumindest eine 
Spracherkermungseinrichtung (1), der ein gesprochener Text (GT) zufuhrbar und in einen 
erkannten Text (ET) transkribierbar ist, sowie eine mit der zumindest einen 

5 Spracherkennungseinrichtung (1) fiber ein Datennetz (2) zur Ubertragung des erkannten 
Textes (ET) und gegebenenfells des gesprochenen Textes (GT) verbundene 
Korrektureinrichtung (3) zum Korrigieren des von der zumindest einen 
Spracherkennungseinrichtung (1) erkannten Textes (ET) umfasst, 
dadurch gekennzeichnet, 

10 dass die Korrektureinrichtung (3) ein Alternativen-Lexikon (23) aufweist, das Wortteile, 
Worter bzw. Wortfolgen enthalt, die von der Korrektureinrichtung (3) als Alternativen zu 
einzelnen Wortteilen, Wortern bzw. Wortfolgen des erkannten Textes anzeigbar (22) sind. 

2. Korrektureinrichtung zum Korrigieren eines von einer 
Spracherkennungseinrichtung erkannten Textes, 

IS dadurch gekennzeichnet, 

dass in der Korrektureinrichtung (3) ein Alternativen-Lexikon (23) gespeichert 
ist, das Wortteile, Worter bzw. Wortfolgen enthalt, die von der Korrektureinrichtung (3) a> 
Alternativen zu einzelnen Wortteilen, Wortern bzw. Wortfolgen des erkannten Textes 
anzeigbar (22) sind 

20 3 . Korrektureinrichtung gemaB Anspruch 2, gekennzeichnet durch 

Analysemittel (24) zum Analysieren von selektierten Textstellen des erkannten Textes, 
vorzugsweise mittels Zeichenkettenvergleich oder syntaktische Analyse, und zum 
Ermitteln von Alternativen zu den selektierten Textstellen aus dem Alternativen-Lexikon 
(23). 

25 4. Korrektureinrichtung gemaB Anspruch 3, dadurch gekennzeichnet, dass die 

Analysemittel (24) durch einen Benutzer der Korrektureinrichtung aktivierbar sind. 

5. Korrektureinrichtung gemaB Anspruch 3, dadurch gekennzeichnet, dass die 
Analysemittel (24) selektierte Textstellen aus der Cursor-Position oder der 
Markierungsmformation eines Textverarbeitungsprogramms ermitteln. 

30 6. Korrektureinrichtung gemaB Anspruch 3, dadurch gekennzeichnet, dass die 

Analysemittel (24) selektierte Textstellen aus der Zeitposition des gesprochenen Textes 
und deren Verkniipfung mit dem erkannten Text ermitteln. 
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7. Alternativen-Lexikon-ErsteUungsverfahr zum Ermitteln von 
Datensatzeintragen fur ein Alternativen-Lexikon (23) fiir die Korrektur von erkanntem 
Text (ET), der von einer Spracherkeimungseinrichlung (1) aus gesprochenem Text (GT) 
transkribiert wurde, dadurch gekennzeichnet, 

5 dass von der Spracherkennungseinrichtung (1 ) unabhangige Wissensquellen 

(12, 13), insbesondere fiir das Anwendungsgebiet spezifische Textdateien, wie 
medizinische oder juristische Texte, oder aus einer Vielzahl von korrigierten Texten (KT) 
und zugehorigen von Spracherkenniingseinrichtungen erzeugten erkannten Texten (ET) 
erstellte Verwechslungsstatistiken, auf miteinander verwechselbare Textelemente, wie 
10 Wortteile, Worter bzw. Wortfolgen untersucht werden, und solche miteinander 
verwechselbaren Textelemente als Alternativen in einem Datensatzeintrag des 
Alternativen-Lexikons (23) zusammengestellt werden. 

8. Alternativen-Lexikon-Erstellungsverfahren nach Anspruch 7, dadurch 
gekennzeichnet, dass die in einem korrigierten Text (KT) gegenuber dem 

1 5 zugrundeliegenden, von einer Spracherkennungseinrichtung transkribierten erkannten Text 
(ET) vorgenommenen Textelement-Ersetzungen ermittelt und als Alternativen in 
Datensatzeintrage des Alternativen-Lexikons aufgenommen werden. 

9. Alternativen-I^xikon-Erstellungsverfahren nach Anspruch 8, dadurch 
gekennzeichnet, dass die Haufigkeit einer jeweiligen Textelement-Ersetzung statistisch 

20 ausgewertet und die Aufhahme als Alternative in einem Datensatzeintrag des Alternativen- 
Lexikons nur dann vorgenommen wird, wenn ein vorgegebener unterer Grenzwert der 
Haufigkeit, ausgednickt durch die absolute Anzahl an Ersetzungen, oder das Verhaltnis an 
Ersetzungen zur Gesamtzahl von untersuchten Wortern oder zum Gesamtauflxeten eines 
bestimmten Wortes, uberschritten wird. 

25 10. Altemativen-Lexikon-Erstellungsverfahren nach Anspruch 9, dadurch 

gekennzeichnet, dass die Haufigkeit einer jeweiligen Textelement-Ersetzung statistisch 
ausgewertet und die Aufhahme als Alternative in einem Datensatzeintrag des Alternativen- 
Lexikons nur dann vorgenommen wird, wenn ein vorgegebener oberer Grenzwert der 
Haufigkeit, ausgedriickt durch die absolute Anzahl an Ersetzungen oder das Verhaltnis an 

30 Ersetzungen zur Gesamtzahl von untersuchten Wortern, unterschritten wird. 

11. Altemaliven-I^xikon-ErsteUimgsverfahren nach Anspruch 8, dadurch 
gekennzeichnet, dass eine Analyse der akustischen Ahnlichkeit der Textelement- 
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Ersetzungen vorgenommen wird und die Aufhahme als Alternative in einem 
Datensatzeintrag des Alternativen-Lexikons nur dann vorgenommen wird, wenn ein 
vorgegebenes MaB an phonetischer Ahnlichkeit gegeben ist. 

12. Altemativen-Lexikon-Erstellungsverfahren nach Anspruch 8, dadurch 

5 gekennzeichnet, dass eine Analyse der Zeitpositionen der Textelement- Ersetzungen 
vorgenommen wird und die Aufhahme als Alternative in einem Datensatzeintrag des 
Alternativen-Lexikons nur dann vorgenommen wird, wenn fur das ersetzte Textelement im 
zugrunde liegenden gesprochenen Text (GT) in ausreichender zeitlicherNahe ein 
entsprechendes Textelement vorhanden ist. 

10 13 . Alternativen-Lexikon-Erstellungsverfahren nach Anspruch 7, dadurch 

gekennzeichnet, dass die Datensatzeintrage des Alternativen-Lexikons nach Sprachen (14) 
unterteilt werden. 

14. Alternativen-Lexikon-Erstellungsverfahren nach Anspruch 7, dadurch 
gekennzeichnet, dass die Datensatzeintrage des Alternativen-Lexikons nach Fachgebieten 
15 (15) bzw. Anwendungsgebieten unterteilt werden. 

16. Altemativen-Lexikon-Erstellungsverfahren nach Anspruch 7, dadurch 
gekennzeichnet, dass die Datensatzeintrage des Alternativen-Lexikons nach Autoren (16) 
des zugrundeliegenden gesprochenen oder korrigierten Textes unterteilt werden. 

17. Altemativen-Lexikon-Erstellungsverfahren nach Anspruch 7, dadurch 

20 gekennzeichnet, dass das Alternativen-Lexikon (23) wahrend der Korrektur von erkannten 
Texten online adaptiert wird. 
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•Znsammenfassung: 

Spracherkennunes- und Korrektursvstem 

5 Bei einem Spracherkennungs- und Korrektursystem, das zumindest eine 

Spracherkennungseinrichtung (1), der ein gesprochener Text (GT) zufiihrbar und in einen 
erkannten Text (ET) transkribierbar is^ sowie eine mit der zumindest einen 
Spracherkennungseinrichtung (1) uber ein Datennetz (2) zur Obertragung des erkannten 
Textes (ET) und gegebenenfalls des gesprochenen Textes (GT) verbundene 

10 Korrektureinrichtung (3) zum Korrigieren des von der zumindest einen 
Spracherkeimungseinrichtung (1) erkannten Textes (ET) umfesst, weist die 
Korrektureinrichtung (3) ein Alternativen-Lexikon (23) auf, das Wortteile, Worter bzw. 
Wortfolgen enthalt, die von der Korrektureinrichtung (3) als Altemativen zu einzelnen 
Wortteilen, Wortem bzw. Wortfolgen des erkannten Textes anzeigbar (22) sind. 

15 (Figur 1) 
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